Euskara hizkuntza txikia da. Txikia hiztun aldetik, baina baita baliabide ekonomiko aldetik ere. Eta hori edozein arlotan nabaritzen bada, are gehiago hizkuntz teknologiekin lotutako baliabideetan, oso oinarrizkoak diren hainbat zerbitzu eta baliabide ez baititugu. Bi adibide oso argi corpusak eta interneteko bilatzaileak dira. Corpusak formatu elektronikoan dauden testu bildumak dira, hizkuntzaren ikerketan eta hizkuntza teknologien garapenean erabiltzen direnak. Corpusak oso baliabide garrantzitsuak dira hizkuntza batentzat. Beharrezkoak dira hizkuntz teknologiak garatzeko, hiztegiak egiteko, normalizazioa aurreko erabileran oinarritzeko... Eta euskarak oso corpus gutxi eta txikiak ditu, beste hizkuntza batzuekin konparatuta. Baina beste alde batetik hor dago internet, denen eskura dagoen corpus erraldoi bat azken finean, baina orain arte existitzen diren baliabideekin behintzat corpus gisa ustiatzeko zaila dena. Ba hori da azken finean Elhuyar I+Gn garatu dugun CorpEus: internet euskarazko corpus gisa erabiltzea ahalbidetzen digun tresna. Emandako hitzak interneten dituen agerpenak erakutsiko dizkigu, bakoitza bere testuinguruan, edozein corpusek egingo lukeen moduan. Bilaketa lema bidezkoa da (hau da, ez ditu emandako hitz zehatzaren agerpenak soilik, hitzaren edozein flexiorenak ere bai baizik) eta euskarazko orrietan soilik egiten da. Horretarako interneteko bilatzaile nagusiek eskaintzen dituzten web bidezko API-ez baliatzen gara. Interneteko bilatzailea da euskaldunok falta dugun beste tresna bat. Google-eta hor daudela esango du norbaitek, baina horiek ez daude euskararako pentsatuta eta berauek erabiliz ezin da euskarazko ganorazko bilaketarik egin. Batetik, bilatzaileek emandako hitzaren forma zehatza duten dokumentuak bueltatzen dizkigute, ez hitzaren deklinazioen agerpenak. Bestetik, bilatzaile batek ere ez du euskarazko orrietan soilik bilatzeko aukerarik ematen gaur egun. Bilatu nahi dugun hitzak euskaraz soilik existitzen badu emaitzek agian balioko digute, baina hitzak beste hizkuntzaren baten ere zentzurik badu edo izen berezi bat bada, beste hizkuntzetako emaitzak ere agertuko zaizkigu (edo batzuetan horiek bakarrik). Hutsune hori betetzera dator EusBila: interneteko ohiko bilatzaile bat da, baina euskarazko bilaketak egiteko prestatua. Horrela, euskararen berezitasunak kontuan hartzen ditu, eta lema bidezko bilaketak egin daitezke euskarazko internetean. Tresna honek ere bilatzaileen web bidezko APIak erabiltzen ditu. Web 2.0-k eskura jartzen dizkigun baliabideak gurea bezalako hizkuntza txiki baten mesedetan erabil ditzakegu eta erabili behar ditugu. CorpEus eta EusBila horren bi adibide garbi dira.